Hadoop : NoSuchMethodException

hadoop - phoenix jdbc 不工作，没有异常并卡住

我是phoenix的新手，hbase.hbase表和phoenixView运行良好，我可以通过phoenix获取数据。当我访问jdbc到phoenix时，它卡住了。importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.ResultSet;importjava.sql.SQLException;importjava.sql.Statement;publicclassPhoenix{privatestaticStringdriver="org.apache.phoenix.jdbc.PhoenixDriv

卡住 phoenix code section hadoop jdbc hbase apache-phoenix

hadoop - nifi FlowFile 尚未关闭(Groovy 脚本)警告

nifi术语和流文件处理的新手。找到了一种方便的方法来处理传入的xml并使用XmlSlurper对其进行解析，但是对于传入流文件的以下GroovyScript收到警告-流程:处理器细节:脚本正文:defflowFile=session.get()if(!flowFile)returnInputStreami=flowFile.read()newXmlSlurper().parse(i)i.close()REL_SUCCESS似乎是处理流文件的问题。有人可以解释这里到底发生了什么以及如何最好地处理它吗？似乎这导致集群有时挂起最佳答案

FlowFile 尚未 section image hadoop groovy cloudera apache-nifi hortonworks-data-platform

hadoop - 从给定查询的配置单元日志中获取应用程序 ID

在我们的环境中，我们有许多用户从不同的工具发出Hive查询。很多时候用户会给我们查询，说在某个时候失败了，我们需要深入挖掘，找到原因。所以我们需要解析Hive日志并找到查询。找到查询是比较容易的部分，有没有办法很容易地找出一旦在配置单元日志中找到查询(通常在执行命令之后)，我如何轻松地获得与之关联的yarn应用程序ID？我正在尝试自动执行此过程，以便减少我们的分析时间。谢谢最佳答案您可以做的一件事是，您可以使用yarnapplication-list-appStatesALL命令。它的作用是，它将为您提供所有应用程序的列表及其各

配置单给定 section code hadoop hive hadoop-yarn

hadoop - 既然 HDFS 已经提供了数据存储，为什么还要 Hive？

我已经开始学习Hadoop。我知道HDFS提供分布式存储系统，而Mapreduce用于数据处理。现在我正在阅读Hadoop生态系统。从Hive的定义来看，它是一个建立在hadoop之上，提供类SQL接口(interface)的数据仓库。我的问题是当hadoop提供容错的分布式HDFS时，为什么要配置单元？Hive会取代HDFS吗？hive是只提供sql接口(interface)还是也提供存储？最佳答案 Hive不会取代HDFS。Hive为存储在HDFS中的数据提供了sql类型的接口(interface)。它主要用于查询和分析存储的

hadoop HDFS section Hive mapreduce

hadoop - Hive转HBase的问题

我看到一个外部Hive表存储了HBase的数据:CREATEEXTERNALTABLEIFNOTEXISTSods.demo_table(rowkeyStringCOMMENT'rowkeyofhbase',....)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"="info:...")TBLPROPERTIES("hbase.table.name"="...","hbase.mapred.output.outputtable"="

hadoop HBase strong hive

unix - 我们可以在 linux 中使用 hadoop fsck 命令时跳过文件检查吗？

我想使用hadoopfsck命令跳过指定路径上的文件检查。我们能做到吗？我正在使用以下命令:hadoopfsck>/output.txt我也检查了hdfs指南，但是没有什么可以从上面的命令中排除路径。请帮忙。最佳答案从Hadoop2.9.0开始，无法在hadoopfsck命令中指定排除路径。但是您可以使用WebHDFSRESTAPI获取与fsck相同的文件系统健康信息。使用此API，我们可以使用LISTSTATUSapi获取目录内所有文件的信息，或使用GETFILESTATUSapi获取单个文件的信息。对于目录:curl-i"h

hadoop linux 34 section modificationTime unix hdfs

hadoop - 哪些进程需要访问 core-site.xml 和 hdfs-site.xml

Thecore-site.xmlfileinformsHadoopdaemonwhereNameNoderunsinthecluster.ItcontainstheconfigurationsettingsforHadoopCoresuchasI/OsettingsthatarecommontoHDFSandMapReduce.Thehdfs-site.xmlfilecontainstheconfigurationsettingsforHDFSdaemons;theNameNode,theSecondaryNameNode,andtheDataNodes.Here,wecanconfi

site core-site section code hadoop hdfs

hadoop - 按尺寸对 yarn 的运行应用进行排名

我想到了一种按大小列出yarn正在运行的应用程序的方法。因为大小分为分配的MB和分配的VCore，我决定假设一个VCore大约为10000MB。#Useshttpieandjq,oryoucouldusecurlwith-HContent-Type:application/jsonhttphttp://yarn-web-ui-url:port/ws/v1/cluster/apps|jq'.apps.app|sort_by(.allocatedMB+.allocatedVCores*10000)|reverse|.[]|select(.state=="RUNNING")|{name,al

排名 hadoop section allocatedVCores allocatedMB hadoop-yarn jq

hadoop - 更改主机名后的 java.net.ConnectException

我在独立模式下设置了hadoop，默认主机名为“raspberrypi”。一切似乎都在起作用。然后我通过以下操作将主机名更改为hnode1:echo"hnode1"|sudotee/etc/hostname在/etc/hosts中我改变了127.0.0.1raspberrypi到127.0.0.1hnode1我所做的唯一其他更改是在core-site.xml中:fs.default.namehdfs://localhost:9000改为fs.default.namehdfs://hnode1:9000但是，在尝试从本地文件系统复制到hdfs时重新启动服务后出现此错误:CallFromh

ConnectException hadoop code section pre

hadoop - apache pig中一列的最大值

我正在尝试使用pig查找列ratingTime的最大值。我正在运行以下脚本:ratings=LOAD'/user/maria_dev/ml-100k/u.data'AS(userid:int,movieID:int,rating:int,ratingTime:int);maxrating=MAX(ratings.ratingTime);DUMPmaxrating示例输入数据是:19624238812509491863023891717742223771878887116244512880606923我遇到以下错误:2018-08-0507:02:05,247[main]INFOorg.

hadoop apache code section ratings apache-pig

74 75 767778 79 80